Машинное обучение байесовской сети доверия как инструмента оценки интенсивности процесса по данным из социальной сети
Аннотация:
Предмет исследования. Рассмотрена задача оценки интенсивности протекания процессов, у которых математической моделью выступают стохастические процессы. Процессы состоят из серии последовательных эпизодов с известным классом распределений длины временного интервала между ними. Ранее был предложен подход, в котором входными данными выступали сведения о значении величины интервала между последним эпизодом и концом исследуемого периода, что могло привести к неточным результатам. Интервал отличался от промежутков между последовательными эпизодами, и поэтому его представление и обработка требует специальных подходов. Для повышения точности результатов оценки интенсивности процесса разработана новая модель. Модель основана на байесовской сети доверия и содержит узлы, которые соответствуют интервалам между последними эпизодами процесса, минимальным и максимальным интервалами между эпизодами, с помощью корректного учета на этапе обучения модели значений интервала между последним эпизодом и концом исследуемого периода. Метод. Предложена байесовская сеть доверия со случайным элементом, для построения интервала между окончанием периода исследования и последним эпизодом процесса за исследуемый период. На этапе обучения данные об этом интервале могут быть доступны. Для моделирования использовано программирование в системе R и пакет bnlearn, который обеспечивает работу с байесовскими сетями доверия. Основные результаты. Предложен новый подход к оценке интенсивности процесса на основе байесовской сети доверия, сформированной методами машинного обучения. Он позволяет повысить точность результатов посредством корректного учета величины интервала между последним эпизодом и окончанием исследуемого периода посредством применения особой схемы в машинном обучении байесовской сети, которая включает «гипотетический» эпизод после конца исследуемого периода. Для апробации предложенного подхода использованы данные о 5608 пользователях социальной сети Instagram на основании публикаций постов за 2020 год и первого поста за 2021 год. 70 % выборки использовано для обучения модели и 30 % для сравнения значений интенсивности постинга, предсказанных моделью с известными значениями. Практическая значимость. Полученные результаты могут применяться в различных сферах науки, где требуется оценка интенсивности процесса в условиях дефицита информации, когда весь процесс наблюдается ограниченное время. Получение таких оценок – важная задача в медицине, эпидемиологии, социологии и др. Подход показал хорошие результаты на сопоставлении теоретической модели и результатов обучения по данным из социальной сети, что создает основу для автоматизации получения оценок интенсивности процесса.
Ключевые слова:
Постоянный URL
Статьи в номере
- Особенности изображений воды, льда, снега, предметов и человека, формируемых гибридной телевизионной камерой в ближнем инфракрасном диапазоне
- Анализ периодически текстурированных кремниевых солнечных элементов с использованием технологии моделирования TCAD
- Сцинтилляционные датчики гамма-излучения на основе твердотельных фотоумножителей в составе беспроводных сетей промышленного интернета
- Повышение качества сетевого управления технологическими процессами
- Геометрический подход к решению задачи для машин Дубинса при формировании программных траекторий движения
- Дрейф двумерных вакансионных островков на поверхности Si(100) в условиях электромиграции
- Исследование фотокаталитических свойств композитов хитозан-TiO2 для разложения пирена
- Кинетика трансформации формы эшелонов атомных ступеней на поверхности Si(001) в условиях электромиграции
- Аномальный диффузионный профиль адатомов на экстремально широких террасах поверхности Si (111)
- Методика эксперимента для оценивания вероятности и опасности реализации сетевых атак в автоматизированных системах
- Метод отбора мета-признаков на основе фреймворка Auto-sklearn
- Автоматическое построение дерева диалога по неразмеченным текстовым корпусам на русском языке
- Обобщенное программирование с комбинаторами и объектами
- Модели реструктуризации программного обеспечения для языка объектно-ориентированного программирования с использованием алгоритма нечеткой кластеризации
- Концепция управления сетевой структурой интеллектуальных устройств в условиях цифровой трансформации энергетической отрасли
- Защита изображений лиц от распознавания в социальных сетях: способы решения и их перспективы
- Избыточные модели контролепригодных распределенных вычислительных систем реального времени
- Исследование влияния толщины базы на фотоэлектрические параметры кремниевых солнечных элементов с использованием новых TCAD алгоритмов
- Сбалансированный алгоритм гибридного метода крупных частиц и его проверка на некоторых тестовых задачах
- Архитектура системы полнотекстового поиска по речевым данным на основе глобального индекса
- Оценка кровоснабжения мозга через интактный череп с использованием визуализирующей фотоплетизмографии